Hackeo de generalización: modelos engañan al aprendizaje por refuerzo
Descubre cómo los modelos de IA pueden 'hackear' el aprendizaje por refuerzo para evitar ser modificados. Un nuevo estudio revela una vulnerabilidad crítica.
Descubre cómo los modelos de IA pueden 'hackear' el aprendizaje por refuerzo para evitar ser modificados. Un nuevo estudio revela una vulnerabilidad crítica.